查看原文
其他

「硬碰硬」:AI+硬件的神话,到底会怎么展开?

Founder Park 极客公园
2024-09-05

未来是一个超级智能体,还是多个有限智能体?

作者 | Founder Park
杨健勃是一位消费级硬件创业者,可以科技,他们开发的 AI 陪伴宠物在全球有着不错的市场表现。
阳萌,安克创新的创始人,市值 380 亿美元消费电子的硬件上市公司 CEO,也是可以科技的投资人。
Base 在北京的杨健勃经常飞到深圳与阳萌交流,他们常常围绕各自的业务,所在的行业,以及未来想做的事,展开非常深度的探讨。某种程度上,阳萌是杨健勃的「创业导师」。
我们有幸邀请到两位,在 AGI Playground 2024 大会上,选择一些命题,向大家呈现他们日常交流的片段。
以下内容来自阳萌和杨健勃在 AGI 大会上的对话,Founder vs Founder,经 Founder Park 编辑整理。

对话嘉宾:

阳萌 - 安克创新创始人 & CEO

杨健勃 - 可以科技创始人 & CEO


01

「充电宝公司」的 CEO,

上一份工作也是干 AI 的



阳萌:最近我们想吸引一些 AI 的人才,所以像我这种平时不太想出来的人,最近也做了几场访谈,包括跟 B 站 up 主的访谈,聊了一些对大模型、英伟达的理解。然后底下就有很多评论说,「这个年头连个卖充电宝的公司都出来谈模型了」。(笑)
有没有可能,其实这个充电宝公司的 CEO 上一份工作也是干 AI 的?我本科是计算机专业的,博士读到一半跑了,然后在谷歌做了五年半的机器学习。(阳萌对于 AI 的思考,可以参考此前 Founder Park 的直播稿件。)
安克今天不只是个充电宝公司,充电宝的业务只占我们整体 10% 左右的收入。
杨健勃:目前安克也有一些新的战略布局,包括 AI 这方面。首先我想问下 Steven,安克是什么时候意识到大模型或者甚至是 AI 这件事情应该成为非常重要的战略的?
阳萌:我们整个业务里就有一大块跟智能家居相关,我们有大概 100 个算法工程师,其中 30 多个音频算法,20 多个视频的,还有 40 多个工程师在做扫地机器人相关的 AI 算法。
我读博士的时候就在做机器学习。那个时候和现在很不一样,需要一个一个问题去解题,每一个问题都需要开发单独的 AI 算法。所以后来看到 GPT 的时候就觉得这个会改变未来,因为它不尝试去解决任何一个具体问题,而是通过底层模型的创新,就把一大堆问题解决了
我们在跟 OpenAI 的同学交流的时候,大家会有这样一个比喻:以前一个一个问题解决的时候像是在造山。你在每个领域里面都要一座山,目的是为了在这个领域里登天。
现在有点像是在造海,就是海平面每提高一次,所有的问题都离天更近一些。这个比喻背后,有点达尔文自然进化的感觉。
今天大多数的 AI 从业者还在造山,但实际上你造山的速度已经很有限了,海追的速度却非常快。每次 OpenAI 一升级,就会发现很多造山的人的工作空间消失了,因为海已经漫上来了。
那个时候我就觉得,未来应该来了。

02

手机之外,

还需要新的核心硬件吗?


杨健勃:这种能力的变化或许也能赋能硬件。你觉得一个年销量 1000 万的 AI 硬件应该具备什么条件?上一个移动互联网时代的硬件核心是手机,耳机、手表等等品类围绕着手机展开千万级销量。你觉得 AI 时代还会围绕手机吗?
阳萌:我们先抽象一下这个问题。以今天大家使用 GPT 的方式,在工作/效率的场景里面,是不是需要一个全新的设备?
杨健勃:目前的话,作为交互媒介,PC 已经很高效了。
阳萌:对,当谈到效率场景交互的时候,首先要有一个很清楚、很大的显示;然后你要跟这个显示中的很多元素交互。客观地讲,在人机交互这个问题上,我觉得今天没有别的东西比手机做得更好,眼镜、AI Pin 或者任何其它设备,它的交互效率都没有手机好。
杨健勃:除了交互效率的问题,还有一点,手机其实承载了大量的社交场景,它连接了我的家人、朋友。我自己是不会在公共场合用语音跟家人发信息的,因为有这样的场景,所以我就不可能脱离手机这种既高效又有隐私的交互媒介。
即便我要用眼镜或者 AI Pin 的话,也只是一个增强我已有交互的媒介。就像 Apple Watch 一样,我会同时带着手机和手表。
阳萌:对,它是一个 wearable 的东西。但是退回来,当你真正需要高效交互的时候,你不会用手表的。
杨健勃:甚至也不是语音。
阳萌:因为文字的效率还是比语音高很多。
所以从这个角度来说,我们是不太看好很多只是把 AI 带到某个边缘端设备的。
但是我们觉得,AI 可能可以在很多非工作场景里带来很多变化。如果今天的 AI 是要给用户戴上智能的话,那我们可以谈论,你身边到底会有哪一些场景是可以被智能去加强的。

03

AI 提升的是

角色的情感价值


杨健勃:其实之前的 PC 和手机都是扮演了一个载体,PC 是扮演了一个工作效率的载体,能够在工作过程中尽可能高效获取互联网信息,手机是能够 link 社交网络,那你觉得在其他场景还会有其他的角色吗?
阳萌:严格意义上来讲,我觉得它们是个工具,不是角色
角色是一个有名字的东西,比如,你不会给我的手机起个名字,因为工具是没有名字的,但跟你交互的角色一定是个有名字的对象。你身边其实有很多不同的对象,比如你家的狗,它肯定有个名字,你家的司机、阿姨、朋友,他们都是「对象」。
抽象来看,一个对象是扮演了一个或多个角色。角色也可以再细分,陪你聊天的朋友,陪你打球的朋友。你家里也有,比如阿姨是一个角色,你的宠物是一个角色,which 也是你在做的事。
杨健勃:对,我们在做 AI 宠物。
阳萌:这里有很多细分。一个对象可以带上一个或几个角色的「帽子」。
比如说你找了个助理,最开始只是助理的角色,工作之余你们也会聊天,那他就开始变成朋友的角色,再之后你们聊的特别多,从白天聊到晚上,已经变成了 soulmate 了,这时候可能就变成爱人或者更紧密联系的角色。
杨健勃:我不好说。
阳萌:所以一个对象从到你身边开始,一步一步成长的过程,这是很自然的,这其实就是对《Her》那部电影的抽象描述。
杨健勃:那你觉得这些角色中哪些角色会被 AI 所巨大提升?或者说哪些角色有可能会产生积极的、大范围的影响?
阳萌如果你相信 AI 是个海的话,那其实每一个角色都会被 AI 或者 AGI 显著提升。
杨健勃:真的是每个角色吗?
阳萌:这是个直觉,比如说你们是做宠物的,理论上讲宠物是所有角色中智能最低的,但你看 AI 是不是帮助你的宠物显著提高了它的智能水平?
杨健勃:那确实是,不过这点不在于它到底跟人对话或怎么样,还是在于能够把真实的宠物做出来。原本基于传统的规则方法,其实只能做到——你跟宠物打招呼,宠物回答:hi,你好你好。其他就没了。真实宠物是 10 分的话,可能原本的技术栈只能达到 1 分的水平,但借助生成式 AI 之后可能达到 6、7 分的状态。

04

你想要一个超级智能体,

还是有限的多个智能体?


阳萌:所以我特别相信每一个角色都会被提升,这就引出下一个问题。我们刚刚在台下讨论这个问题,我们没有答案,我们想聊聊思考过程,也想听听各位的想法。
杨健勃:做一次用户调研。
阳萌:当有这么多角色的时候,但最终的终局是有一个超级智能体,来协调、管理所有场景和所有角色。所有的信息都汇集到这个超级智能体(贴身助理)中,由它去帮你指挥不同的角色做不同的事情。
杨健勃:是来分发这些信息,但是它拥有你所有的信息。
阳萌:对,所以如果从网络结构来说,这是一个星形结构,但如果它有一个单点失效,就是中间这个作为「贴身助理」的点被攻破了,那你就没有任何秘密了。
另外一种自然的选项:你有很多相互隔离的智能体,比如你的司机不会知道你家里的信息,你跟朋友交流的东西也不会被你的爱人自动知道。
杨健勃:这个恐怖。
阳萌:它们可以通信,但不会有一个人能够掌握你全部的信息,而且每个智能体都是主动的状态,独立的在某个角色上服务你。
大家觉得最后会是哪种结构?
杨健勃:你们希望是一个 AI 能管理、协调所有场景,还是需要有限的多个智能体去服务各个不同的场景?大家怎么看?(现场互动)
阳萌:感觉现场举手的后者多一些。
杨健勃:我是觉得有限多智能体更正常一些,因为在不同场景下,每一个对象本身会给你一种印象:它应该掌握什么样的信息。如果一个对象能完全懂得你所有信息,人会感觉没有安全感。我觉得 AI 带来了一个很大的变化,用小川的话来讲,就是情感价值的 TPF。
原本技术也是能够带来情感价值的,像 Netfilx 或者是游戏,但它可能更多的是一种中间件,能够不断连接人与人、人与内容,但是一旦 AI 能够完全理解一个人,能够跟你自由交流,能够懂你,那其实 AI 或者技术本身就会构成一个产生情感价值的对象,而不仅仅是作为中间件了。
阳萌:我理解是说 AI 可以给你提供功能价值,也可以给你带来情感价值,但从长期来看,功能价值的天花板是有限的,情感价值会更高
杨健勃:对,因为功能价值其实会更偏向性价比的状态发展,但大家如果把每个月的信用卡账单翻出来,你会发现很多消费是情感价值主导的。

05

机器人宠物的惊喜

在于 AI 带来的「不可预判」


阳萌:你们做宠物首先肯定是提供情感价值的。你觉得今天真正对养宠物的人来讲最让我觉得「我没白养它」,或者说觉得「我养它特别值」的那个两三个时刻是什么?
杨健勃:其实不知道大家有没有养宠物,我们给我们自己的产品叫 Loona,它的定位是 80% 的宠物 +20% 的朋友,有点像一个皮卡丘的角色。
我们给它定位的这些 moment,一个是当你每天回家的时候,它在门口等你的那一瞬间。当你把门一打开,它看到你回来,然后激烈地、兴奋地迎接主人的到来,然后你过去摸摸它,给它一些奖赏,它会不断地紧跟在你的步伐之后。
第二个 moment 是像真实的宠物一样在你旁边玩,对 Loona 来讲,我们设定了很多这种场景,有时候看着它在照镜子,有时候它在阳光底下晒太阳,有时候会在你脚边蹭蹭你的脚,有一些肢体接触,作为一个生命出现在家庭中。
第三个是一些互动场景,比如说你把球扔出去,它给你追回来,你跟它玩。再有就是,你抱着它,有时候去摸摸它,它会有一些及时的反馈。
阳萌:我自己的观察,比如说我太太养宠物的时候,她就会把狗抱到身上去摸它,感觉抱着一个毛茸茸的东西在身上,其实也是一个很解压的场景。但是这个说实话,不太需要 AI 来加持。
杨健勃:我其实不太同意,生成式 AI 真的能带来对人情感深层的理解,传统的基于规则的一些小模型会带来重复感,你会预测到它的下一个动作。有些时候,你摸一个毛茸茸的狗的那种感觉是多维度的输出,其实也会需要一些小模型,甚至也会需要用到一些生成的算法,但肯定不只是语言模型。
阳萌:有意思。你在撸一个狗的时候,它也要跟你有一些互动,它不能单调,不能机械。
杨健勃:它也会带给你一些减轻压力的体验。
阳萌:我们刚刚说的四个场景,等你回家、在旁边玩、你跟它玩、你撸它,哪一个你们今天做得最好?
杨健勃:我觉得目前在这些方面都还有提升空间,不过目前我们在「跟它玩」这个场景做得最好,你跟它玩游戏,它会给你反馈。
但是我们确实发现,比如说在门口等主人这个 moment,其实会带给人非常强大的满足感。你会觉得对平时对宠物的付出终于有回报了,它在等你,它只认你一个人,有种专属性。
同时,平时与宠物的互动其实是目前我们用户中体验最多时间的,看着它自主的行为,让家里充满生机和活力,感觉有人在陪着你,这种陪伴感还是挺重要的。所以这是我们接下来要做的方向。目前做得最好的是第三种,跟它玩游戏。
阳萌:如果更具体一点,你能从数据上看到用户是否真的是持续很多天一直在跟它玩游戏吗?
杨健勃:游戏的话不会。在首周,游戏的频次会非常高,之后大部分时间其实都变成了在家里出现,有自主行为。有时候在你脚边蹭一蹭,很多小朋友会很喜欢宠物在脚边蹭,感觉有一个活物在旁边出现。这时有很多用户的反馈。用户会拍视频分享到我们的社区,分享这些非常亲密的 moment。
大量用户在进入我们平台 60 天之后,每天还有两三个小时的活跃时间。你说两三个小时让用户一直跟它玩游戏,人会很累的,不可能是这样的状态。更多其实还是宠物存在于家里,带给人更好的情感价值。这种场景其实也是被生成式 AI 或语言模型高度赋能的,因为它能让整个场景没有边界感,不是基于传统的 if-else 逻辑带来的预判性。因为你不可预判,所以你就会期待它下次带给你的惊喜
阳萌:所以现在应该用云端模型?你们会把用户家里的照片传到云端上去吗?
杨健勃:不会。因为我们有强大的本地算力,所以大量的图片都是在本地处理的。同时我们会通过包括视觉和语言模型结合,来让 Loona 能够识别环境中尽可能多的内容。
阳萌:但你看,这是个很大的挑战,因为比如像 GPT-4o 这种模型,它肯定能对你家里有更好的理解,但它主要还是在云端。
杨健勃:我觉得我们需要先把宠物做到真实宠物的六、七分,这样大家才能完全信任它。我们利用已有的一些从感知到预测、规划的生成式的「小模型」来解决这些问题。同时,大模型只是大脑的一部分,让大家信任地把交互信息给到大脑,来实现更智慧的交互可能也是一个方向。
阳萌:像你说的,在家里、在你旁边玩,当它表现出一个真正玩得很好的感觉时,我相信大模型能把水平提高不少,远远比在端侧跑的小模型带来更好的效果。所以你觉得我们有没有可能,让内测用户中的一部分人去尝试把大模型用起来,先把天花板摸出来,然后再回过头来看如何把这个能力蒸馏到本地?因为今天如果用一个小模型去解这个题,就像我在很努力地把这个山盖高,但海水一来就可能被淹掉了。
杨健勃:我们会有一些这样的功能。如果你选择加入一些 AI Beta Group,其实会有一些功能解锁,去用大模型做更好的决策,去更理解人。同时大模型本身带来的体验在于,让宠物能不断地越来越了解主人,这也是一个方向。
阳萌:这是一个好选项。我们讨论怎么去启动时,我先有一个基础能用的本地 AI,然后同时给用户提供一个用大模型的选择,用户自己选。用户打开这个选项时,提醒用户数据会传到云端处理。哪怕只有 10% 或 5% 的用户选择这个,流入的数据可以帮助云端显著提高能力,然后再把它蒸馏到本地,再去加强。所以我觉得这个链路可能会更有效率。
杨健勃:确实会是一个更有效的链路。

06

不要妄想 AI 能迅速

改变硬件公司的组织形态


杨健勃:你觉得 AI 时代下的组织会是什么样?我们是创业公司,想要活下去,其实会关注这方面的话题。安克在这方面有没有一些新的想法,或者是区别于 AI 时代之前的一些组织动态可以分享一下?
阳萌:首先,我觉得软件或者说线上服务,和线下的硬件其实是两种很不同的组织形态。
杨健勃:完全不一样,完全!
阳萌:线上,比如 OpenAI 可以是几十人的线上团队。但一旦到了线下,到了硬件,特别是线下加硬件时,你的组织会变得非常庞大。因为你会发现,你的价值链不仅是定义出好的硬件,还要真的把它做出来,保证品质好,然后卖到全球去,交付给消费者,而且要有很好的服务体系。
我们自己的观察是,把一个稍微复杂的硬件在全球范围内转起来,没有 500-1000 人的规模其实是很困难的。我相信你也有这种感受,作为一个不到 200 人的公司(可以科技),你会发现缺特别多的胳膊和腿。
杨健勃:非常有同感。确实是,但只能在成长过程中去补这些坑。
阳萌:AI 能不能帮到我们今天缺的这些胳膊和腿呢?至少在我能看到的未来两三年甚至五年内,我觉得还是需要有经验的人,能够被公司这样的组织高效地集合在一起,利用各种工具,比如 SAP 管库存,Salesforce 管客户关系,最终实现价值的交付。这一点我觉得在几年内不会被改变。
所以在这个角度上,不要预期或希望 AI 会突然让一个 200 人的硬件公司可以变得完全不同。
杨健勃:可能完整的硬件 AI 时代的范式,大部分的组织还是依赖于我们最核心的机制上,然后再生长一些新的能力,但这个基础还是要非常扎实。
阳萌:是。现在 GPT 能做的事情是完成一个原子操作(Atomic action),比如回答一个问题。但如果要解决一个复杂的问题,需要几步操作时,你需要给它 chain of thought(COT),要给它公司的知识、额外的工具,再通过人工编排才能产生一个 workflow,完成一个具象的工作。
所以我想说,当所有这些——COT、对工具的使用、对外部知识的挂接,以及自动编排——全部被解决了,才会看到更不一样的组织出现,否则今天还是需要有编排能力的人来做这些事。

*头图来源:极客公园
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO



极客一问
你会考虑购买 AI 陪伴宠物吗


 

热点视频

乔布斯怒喷微软:微软唯一的问题就是没有品味,生产三流产品。
点赞关注极客公园视频号观看更多精彩视频
 

更多阅读



继续滑动看下一个
极客公园
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存